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摘 要 通过 文献 检索 和 筛选 ,选取 了 43 个 校园 其 凌 的 干预 研究 , 使 用 CMA 3.0 分 析 干 预 效果 及 影响 因素 ， 
并 使 用 GRADE 系统 对 所 有 结局 指标 的 证 据 质量 进行 评估 。 结 果 显 示 , 针对 欺凌 者 的 干预 项 目 具 有 中 等 效果 
量 (g = 0.57, p < 0.05); 针对 坎 凌 受害 者 的 干预 项 目 使 得 受害 者 的 受 捧 凌 行 为 减少 (9 = 0.42, p < 0.05), 心理 健 
康 得 到 改善 (g = 0.40, p < 0.01); 针对 所 有 学 生 的 坎 凌 干预 项 目 对 其 欺凌 行为 的 效果 g = 0.17 (p < 0.001)， 对 其 
受 欺 凌 行 为 效果 g = 0.19 (p < 0.001)， 可 能 存在 出 版 偏差 ; 学 生态 度 改 变 的 效果 g = 0.40 (p < 0.01)。 除 了 态度 
改变 的 证 据 质 量 为 中 等 ， 其 他 结局 指标 的 证 据 都 为 低 或 者 极 低 质量 。 对 于 所 有 学 生 干 预 项 目 ， 干 预 周期 小 于 1 
学 期 的 效果 量 大 于 干预 周期 大 于 1 学 期 的 效果 量 ， 教 育 干预 项 目 效果 量 小 于 系统 干预 效果 量 ， 非 随机 研究 效 
果 量 大 于 随机 对 照 研究 .直接 针对 欺凌 者 或 者 欺凌 受害 者 的 干预 效果 量 中 等 ， 但 是 样本 量 少 ， 需 要 进一步 的 研 
究 证 据 支 持 .针对 所 有 学 生 的 欺凌 干预 项 目 虽 然 效 果 量 低 , 但 是 仍 具 有 实践 意义 ， 其 效果 量 受 到 干预 周期 和 干 
预 特征 的 影响 。 

关键 词 校园 反 欺 凌 ; 干预 效果 ; 元 分 析 ; GRADE 

分 类 号 B844 


1 背景 欺凌 形式 、 渠 道 的 多 样 性 提升 了 欺凌 行为 的 
eenaa atag apne ER MRA TER 80 项 报告 青少年 欺凌 行 

si bor N 为 发 生 率 研究 的 元 分 析 发 现 : 传统 的 欺凌 现象 发 生 
n Bae s i A 345%, PRED 15.5% (Modecki, 
等 ,攻击 行 为 是 故意 日 敌意 的 ， WR OE Minchin, Harbaugh, Guerra, & Runions, 2014), — 
° ei — _ 项 整合 了 大 陆 、 台 湾 、 香 港 和 澳门 两 岸 三 地 的 调 
(Olweus，1994a)。 坎 次 的 形式 不 仅仅 包括 直接 的 碍 研究 发 现 ， 青 少年 其 凑 报 告 率 最 高 达到 68% 
暴力 行为 ， 也 包含 间接 的 攻击 行为 ; 内 容 包括 身 人 
AICO LN BAT SHRI), 口头 获 次 ( 例 RAR Ss ESP] 66% (Chan & Wong, 
myg, ABI HEE RB), RAR ld 2015. PRT ARP LR aE ROR SE 
BE, 伤害 他 人 名 着 ) 损坏 受害 者 所 有 物 。 并 且 RAR RARR. HREM, AUS ai 
BEATER IVE, MAM hatin RIUS a RL Ae COLIN, MP. MR 
道 ， 其 包括 电子 邮件 、 短 信 、 视 频 等 Kowalski， 用 ) (Havik, Bru, & Ertesvåg, 2015; McCuddy & 
Giumetti, Sohioeden, & Lattimer 2014), Esbensen, 2017; Ttofi, Farrington, Lösel, Crago, & 
. i Theodorakis，2016)。 而 坎 凌 受害 者 与 低 自 尊 、 低 
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s < 意念 等 心理 问题 (Kelly et al., 2015)。 因 此 校园 欺凌 
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欺凌 的 干预 和 预防 逐渐 引起 政府 、 教 育 部 门 和 公 
众 的 重视 。 

自 1983 年 , Olweus 在 挪威 设计 了 第 一 个 大 规 
模 的 校园 欺凌 干预 项 目 起 , 之 后 的 数 个 效果 评估 
显示 校园 欺凌/ 受害 现象 下 降 了 21%~50% 左 右 
(Olweus, 1994b, 2005)。 随 后 ， 越 来 越 多 研究 者 根 
据 不 同 理论 设计 了 校园 欺凌 干预 项 目 , 并 将 之 应 
用 于 中 小 学 学 校 中 。 这 些 干预 项 目 涉及 个 体 层 面 、 
SRA. ARM, 7B K MS 
(Farrington, Gaffney, Lésel, & Ttofi, 2016)。 在 个体 
层面 , 针对 学 生 对 欺凌 的 知识 、 态 度 进行 教育 ; 在 
学 校 层面 ,制定 一 定 的 校规 , 或 者 组 建委 员 会 处 
HU ERE: 在 家 庭 层面 , 增加 家 长 对 欺凌 的 认 


而 前 后 测 实 验 组 -控制 组 非 RCT 设计 控制 了 因 变 
量 在 基线 水 平 上 的 差异 , 一 定 程度 上 可 以 减少 非 
随机 带 来 的 弊端 ， 这 部 分 的 证 据 也 是 重要 的 。 尽 
管 也 有 元 分 析 纳 入 了 非 RCT 的 对 照 研究 , 但 是 在 
计算 效果 量 的 时 候 却 只 采用 了 后 测 数据 ,忽视 了 
两 组 的 基线 水 平 上 的 异 质 性 。 考 虑 干预 前 测 数据 ， 
计算 两 组 前 后 测 变化 量 的 标准 化 差异 ， 是 更 加 合 
理 的 效果 量 计算 方式 (Hoyt & Del Re, 2017)。 即 便 
对 于 RCT 研究 而 言 , 前 后 测 的 重复 测量 也 能 够 有 效 
提高 统计 效力 和 检验 力 (Carlson & Schmidt, 1999)。 

第 三 ， 对 干预 项 目的 分 类 没有 细 化 。 根 据 干 
预 对 象 ， 反 欺凌 干预 可 以 划分 为 三 类 , 一 类 是 直 
接 指 向 欺凌 者 ， 旨 在 减少 他 们 的 攻击 性 或 者 欺凌 


W, 增强 家 长 和 学 校 的 互动 ; 在 社会 层面 ,制定 
相应 的 政策 应 对 欺凌 事件 。 

在 干预 项 目 之 后 , 大 量 的 实证 研究 对 各 种 反 
欺凌 项 目的 干预 效果 进行 了 检验 , 可 是 得 出 的 结 
果 并 不 一 致 ， 很 多 综述 和 元 分 析 都 对 其 进行 了 梳 
理 。Vreeman 和 Carroll (2007) 归 纳 了 1996 年 至 
2004 年 共 26 个 学 校 的 欺凌 干预 研究 ,， 其 中 有 9 项 
研究 结果 显示 干预 没有 显著 降低 欺凌 或 者 受 欺 凌 
行为 。 Evans, Fraser 和 Cotter (2014) 将 研究 更 新 到 
2013 年 ， 发 现 测量 欺凌 行为 的 22 个 研究 中 ， 只 有 
50% 显 示 干 预 显著 有 效 ， 测 量 受 坎 凌 的 27 个 研究 
中 有 67% 显 示 受 欺凌 行为 显著 降低 。Merrell， 
Gueldner, Ross 和 Isava (2008) 的 元 分 析 计 算 了 校 
园 其 读 干 预 的 效果 量 ， 指 出 反 坎 凌 项 目 效 果 量 很 
低 甚至 无 效 (Merrell et al., 2008)。 但 也 有 一 些 元 分 
析 得 出 校园 欺凌 干预 是 有 效 的 (Jiménez-Barbero， 
Ruiz-Hemandez, Llor-Zaragoza, Pérez-Garcia, & Llor- 
Esteban, 2016; Ttofi & Farrington, 2011). AEA, 
这 些 元 分 析 结果 的 不 一 致 可 能 源 于 纳入 排除 标准 和 
效果 量 计算 的 差异 ， 有 以 下 几 点 需要 进一步 考虑 。 

第 一 , 纳入 研究 的 实验 设计 有 待考 虑 。 在 循 
证 研究 中 , 一 般 认为 随机 对 照 实 验 (random control 
trial, RCT) 具 有 和 较 好 的 信 效 度 。 然而 对 于 学 校 干预 
而 言 ， 要 考虑 学 校 的 意愿 ， 很 难 实现 随机 化 的 分 
配 。 即 使 随机 化 ， 对 参与 实验 的 学 校 数量 也 有 较 
高 的 要 求 。 而 实际 上 很 多 RCT 研究 并 非 大 规模 的 
干预 研究 ， 可 能 并 没有 达到 随机 化 的 效果 。 较 新 
的 一 篇 元 分 析 ， 只 关注 RCT 研究 , 纳入 了 16 篇 研 
究 , 虽然 一 定 程度 上 保证 了 内 部 效 度 , 但 却 忽视 
了 其 他 的 实证 证 据 (Jimknez-Barbero et al., 2016)。 


行为 (Sahin，2012); 一 类 是 直接 指向 欺凌 受害 者 ， 
通过 心理 健康 辅导 、 社 交 技 能 训练 等 提高 他 们 的 
心理 健康 水 平 ， 降 低 受 坎 凌 频率 (Fox & Boulton, 
2003); 还 类 是 更 为 广泛 的 欺凌 干预 ,针对 所 
有 学 生 ， 通 过 教育 、 纪 律 、 和 家 长 社区 的 合作 等 
增强 学 生 对 欺凌 的 认识 ,提升 求助 的 意识 ， 进 而 
学 生 的 态度 和 行为 (Saarento et al., 2015)。 以 上 三 
类 干预 中 ,对 于 特定 对 象 的 干预 而 言 , 干预 和 测 
量 都 是 直接 命中 目标 对 象 ， 需 要 在 干预 前 进行 有 
效 的 识别 。 而 对 于 普遍 干预 而 言 ， 面 向 的 是 所 有 
FE, 是 “预防 + 干预 ”的 结合 。 因此 ， 在 计算 效果 
整体 效果 量 的 ,三 种 类 型 的 干预 是 有 必要 分 开 的 。 

第 三 ,未 对 证 据 质量 强度 作 评 估 或 者 评价 不 
全 面 。 尽 管 元 分 析 是 综合 证 据 结果 的 强 有 力 工 具 ， 
但 是 并 非 所 有 的 整体 效果 量 都 是 有 意义 的 ， 对 于 
证 据 质量 的 强度 的 评价 是 必要 的 。 文 献 质量 评价 
有 多 种 工具 ,例如 Cochrane 风险 偏 倚 评 估 . Jadad 
量 表 等 ,这 些 评估 主要 集中 于 研究 设计 的 质量 
(Zeng et al., 2015), GRADE 工作 组 于 2004 年 正式 
推出 一 套 循 证 医学 证 据 质量 分 级 和 推荐 系统 ， 不 
仅 可 以 评估 RCT 证 据 ,， 也 可 用 于 评估 非 RCT 研 究 
证 据 , 已 经 成 为 国际 接受 的 标准 之 一 。 作 为 系统 
评价 的 一 部 分 GRADE 不 只 关注 研究 的 局 限 性 ， 
还 关注 研究 的 不 一 致 性 、 间 接 证 据 、 结 果 的 精确 
性 、 发 表 偏 傈 ， 更 加 全 面 的 对 元 分 析 结 果 的 证 据 
强度 进行 评估 ， 有 利于 指导 临床 实践 (Alonso-Coello 
et al., 2016)。 此 外 , GRADE 系统 不 仅仅 关注 单一 
结果 , 还 关注 其 他 重要 的 效果 衡量 指标 。 因 此 ,本 
研究 纳入 了 欺凌 行为 、 受 欺凌 行为 、 心 理 健康 、 
态度 等 因 变 量 作 为 衡量 反 欺 凌 干 预 项 目 效果 的 结 
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局 指标 (outcome variables)。 

综 上 ,本 研究 除了 更 新 已 有 的 反 欺 凌 干 预 研 
究 , 还 将 考虑 纳入 前 后 测 实验 组 -控制 组 干预 效 
果 人 研究 , 运用 前 后 测 数据 进行 干预 效果 量 的 计 
算 。 根 据 测 量 对 象 的 不 同 , 我 们 分 别 计算 针对 欺 
凌 者 的 干预 ,针对 欺凌 受害 者 的 干预 及 针对 所 
有 学 生 的 干预 效果 , 并 采用 GRADE 证 据 等 级 评 
价 对 所 有 的 结果 变量 的 证 据 质量 强度 进行 分 级 评 
估 。 此 外 , 我 们 还 将 考察 被 试 年 级 、 干 预 周期 、 
干预 特征 、 实 验 设计 对 干预 效果 的 影响 。 


2 ”研究 方法 


2.1 文献 检索 

在 英文 数据 库 PubMed, ISI Web of Science, 
EMBASE, Science Direct. ProQuest 中 ,使 用 关键 词 
组 合 (Bully*/cyberbully*/anti-bully*) and (school) and 
(intervention/prevention/program/outcome/evaluation/ 
effect/tackling) 进 行 检索 。 同 时 在 中 国 知 网 、 万 方 
和 维普 数据 库 中 , 使 用 关键 词组 合 (欺凌 / 反 坎 凌 / 
网 络 坎 凌 / 霸 凌 /欺负 And 学 校 /校园 And 干 预 /预防 
/效果 ) 检 索 。 检 索 的 截止 时 间 为 2018 年 2 月 。 
22 ”文献 纳入 排除 

对 于 检索 到 的 文献 ,根据 以 下 9 条 标准 进行 
筛选 和 排除 。 具 体 的 纳入 排除 流程 见 图 1。 

(1) 纳 入 主题 为 反 欺 凌 干 预 项 目的 效果 研究 ， 
针对 其 他 暴力 行为 (例如 枪支 使 用 ) 的 项 目 研 究 予 
以 排除 。 

(2) 根 据 其 凌 的 明确 定义 。 坎 凌 形 式 包 括 口 头 
的 、 身 体 的 或 者 心理 的 攻击 , 虽然 是 攻击 的 一 种 
Bak, 但 是 不 等 完全 同 于 攻击 或 者 校园 暴力 。 

(3) 干 预 项 目 应 用 于 社区 、 学 校 、 班 级 、 学 生 
或 者 家 长 中 , 关注 的 是 学 生 对 欺凌 行为 的 态度 、 
欺凌 和 受到 欺凌 行为 的 变化 。 


关键 词 检 索 (n = 5490) 
已 有 综述 和 元 分 析 提 取 (n = 109) 


(4) 随 机 对 照 实验 或 者 准 实验 设计 ,包含 控 
制 组 。 
(5) 结 果 变 量 包括 学 生 对 欺凌 行为 的 态度 ， 以 
及 欺凌 他 人 或 者 受 欺 凌 行 为 结果 。 结 果 报 告 方式 
包括 自 评 报告 、 同 伴 评 分 、 教 师 或 者 家 长 评分 及 
外 显 的 行为 观察 。 
(6) 对 结果 变量 的 涡 
测 ， 干 预后 测 。 
(7) 研 究 中 必须 包含 能 够 计算 效果 量 大 小 的 统 
计 信 息 ， 如 样本 量 , 均值 和 标准 差 , F 值 , p 值 等 。 
如 果 缺 少 该 信息 ， 则 先 尝 试 联系 作者 ， 尽 可 能 获 
取 关 键 变量 的 统计 值 。 
(8) 审 查 使 用 同一 个 研究 项 目 中 同一 批 数 据 发 
表 的 不 同期 刊 论文 , 相同 的 结果 不 再 重复 纳入 。 
(9) 所 选 研 究 不 仅仅 包括 同行 评审 期 刊 论文 ， 
还 包括 学 位 论文 、 书 的 章节 等 。 
23 ”文献 编码 
详细 阅读 和 编码 每 一 篇 纳入 元 分 析 的 文献 ， 
包括 以 下 信息 : (1) 出 版 特征 ， 出 版 年 份 ，(2) 干 预 
寺 征 :干预 周期 ; 干预 措施 (a. 教 育 ; b. 系 统 干 预 ， 
包括 制定 纪律 家长、 学生 教 育 等 ); (3) 干 预 对 象 : 
年 龄 或 者 年 级 ; 主要 对 象 (a. 欺 凌 受 害 者 ; b. 欺 凌 者 ; 
c. 所 有 学 生 ) (4) 结 果 测 量 : 结果 报告 方式 (a. 自 评 ; 
b. 他 评 , 包括 同伴 评价 ， 老师 评价 ,实验 者 观察 )。 
对 于 结果 变量 , 我 们 根据 干预 项 目 针对 的 具 
体 对 象 进行 区 分 。 有 的 反 坎 凌 干 预 项 目 直接 针对 
欺凌 者 或 者 欺凌 受 害 者 ， 这 种 类 型 的 干预 直接 命 
中 目标 , 通常 有 较 好 的 干预 效果 。 而 男 外 一 些 针 
对 广大 学 生 的 干预 项 目 ， 是 普遍 型 干预 ,通常 有 
着 较 低 的 效果 量 , 但 仍然 被 认为 是 有 效 的 ， 因 为 
在 普遍 干预 的 学 生 中 发 生 欺 凌 行 为 的 比例 是 相对 
较 低 的 。 已 有 元 分 析 没 有 具体 划分 不 同类 型 的 干 
预 项 目 ， 可 能 混淆 反 欺 凌 干 预 效 果 。 因 此 ,我们 分 


量 时 间 点 至 少 包括 干预 前 


= 


| 查 重 、 标 题 摘 筛选 
全 文 阅读 


(n = 186) 


yy OY 


排除 研究 (n = 133) 
“ 非 反 欺凌 效果 研究 (xz = 57) 
“ 非 前 后 测 实验 组 -控制 组 设计 (z= 47) 


。 缺 少 前 测 或 者 效果 量 无 法 计算 (n = 24) 


“数据 重复 wx = 5) 


纳入 研究 (n = 43) 
。 针 对 欺凌 者 的 干预 (n = 2) 
。 针 对 欺凌 受害 者 的 干预 (n = 5) 
。 针 对 所 有 学 生 的 干预 (n = 36) 


图 1 文献 纳入 排除 流程 图 


| = 
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别 计算 了 针对 欺凌 者 的 干预 项 目 对 其 欺凌 行为 的 
改善 结果 ; 针对 欺凌 受害 者 干预 项 目 对 其 受 欺 凌 
及 心理 健康 的 效果 ; 针对 所 有 学 生 的 干预 项 目 对 
欺凌 行为 和 受 欺 凌 行 为 的 干预 效果 。 
24 数据 分 析 

首先 计算 每 篇 研究 每 个 结果 变量 的 标准 化 均 
数 差 (standard mean difference, SMD)。 和 以 往 大 部 
分 元 分 析 不 同 的 是 , 为 了 减少 实验 组 和 控制 组 基 
线 水 平 的 差异 , 纳入 研究 为 包含 控制 组 的 前 后 测 
实验 设计 (pre-post with control, PPWC) (Hoyt & 
Del Re, 2017)。 计 算 效 果 量 时 考虑 了 干预 前 测 的 数 
据 ， 先 计算 两 组 在 结果 变量 上 的 前 后 测 变 化 量 的 
差异 ， 再 参照 前 测 数据 的 标准 差 进一步 标准 化 (a)， 
其 中 Spe 表示 的 是 前 测 的 合并 方差 . 通过 实验 组 


和 对 照 组 样本 量 和 标准 差 求 得 (b)。 
TT 
esa post al ( post a (a) 
pre 
0.5 
n, —1S2 -(n. -1)S2 
e Tl ( C ) cl (b) 


pre 
Np +nc —2 


当 样 本 量 小 时 ，SMD 估计 存在 偏差 ，Hedges 
建议 使 用 校正 后 的 标准 化 均 数 差 作为 效果 量 ， 即 
Hedges’ g 值 (Cooper, Hedges, & Valentine, 2009)。 
本 研究 采用 CMA 3.0 软件 对 研究 的 异 质 性 进行 检验 ， 
计算 Hedges’ g, 同时 进行 出 版 偏差 和 亚 组 分 析 。 

异 质 性 检验 采用 Q@ 值 和 卫 评 估 纳 入 研究 结果 
的 差异 性 (Huedo-Medina，Sinchez-Meca，Marfin- 
Martinez, & Botella, 2006). Q 统计 量 效应 量 的 加 
权 离 均 平 方 和 ， 服 从 自由 度 为 ki 的 卡 方 分 布 , Q 
值 越 大 , p 值 越 小 , 说 明 元 分 析 纳 入 研究 的 蜡 质 性 
BK P 反应 了 异 质 性 部 分 在 效应 量 中 总 的 变异 
中 所 占 的 比重 ,一 般 认为 p< 0.05 RE Ë > 50% 研 
究 间 存在 显著 的 异 质 性 。 在 异 质 性 较 大 的 情况 下 ， 
建议 计算 效果 量 时 使 用 随机 效应 模型 (Hedges & 
Vevea, 1998)。 为 了 进一步 分 析 效 果 量 的 异 质 性 来 
源 ， 对 元 分 析 结 果 还 进行 了 敏感 性 分 析 和 亚 组 分 
析 。 敏 感性 分 析 采 取 逐 一 噜 除 每 个 纳入 的 研究 再 
进行 效应 量 的 合并 ,可 以 找 出 效应 量 异 常 的 研 
究 。 亚 组 分 析 从 临床 异 质 性 和 方法 学 异 质 性 的 角 
度 来 探讨 异 质 性 的 来 源 。 本 研究 分 析 的 亚 组 变量 
包括 干预 周期 、 干 预 特征 、 被 斌 年龄、 实验 设计 。 

发 表 偏 倚 指 的 是 在 同类 研究 中 ， 阳 性 结果 的 
论文 比 阴性 结果 的 论文 更 容易 被 接受 和 发 表 的 现 


象 ， 对 元 分 析 结 果 的 推广 具有 重要 影响 。 本 研究 
采用 漏斗 图 (funnel plots) 对 发 表 偏 倚 进 行 评估 。, 漏 
斗 图 是 以 效果 量 为 横 轴 ,样本 量 为 纵 轴 作 散 点 
图 。 理 论 上 认为 小 样本 研究 估计 的 效果 量 差异 较 
K, 分 散在 漏斗 图 的 底部 ， 大 样本 的 研究 估计 的 
效果 量 的 变异 程度 逐渐 降低 ， 因 而 趋 于 密集 在 漏 
斗 图 顶部 。 如 果 漏 斗 图 不 对 称 或 者 不 完整 则 说 明 
元 分 析 结 果 可 能 存在 较 大 的 发 表 偏 傈 。 由 于 漏斗 
图 呈现 结果 较为 粗糙 ， 主 观 性 较 强 ， 因 而 进一步 
采用 剪 补 法 (trim and fil]) 检 验 结果 的 稳定 性 (Duval 
& Tweedie, 2000)。 此 外 , Egger’s 检验 也 被 运用 于 
BB NV AES AY Re AG EZ, FEJ, ES, 2009)。 
25 GRADE 系统 证 据 质 量 

GRADE 系统 是 一 套 证 据 评 价 系 统 ， 是 当前 
证 据 质量 和 推荐 强度 分 级 的 国际 标准 之 一 (Alonso- 
Coello et al., 2016)。 由 于 相对 于 其 他 证 据 评 价 系 
统 更 具有 代表 性 , 在 系统 评价 、 卫 生 技术 评估 及 指 
南 制 作 中 被 广泛 运用 。GRADE 将 证 据 质量 分 为 四 
个 等 级 : 高 ,， 中, 低 , 极 低 。 质 量 高 低 显 示 的 是 进 
一 步 研究 是 否 会 影响 或 者 改变 该 疗效 的 评估 结果 。 

在 GRADE 中 ,基于 RCT 得 出 的 证 据 被 定 为 
高 质量 , JE RCT 研究 属于 低 质量 证 据 。 但 是 二 者 
证 据 质 量 还 要 结合 具体 的 标准 进行 调整 。 其 中 ， 
可 能 降低 证 据 质量 的 因素 共有 4 个 : (1) 研 究 的 局 
BREE; (2) 结 果 的 不 一 致 ; (3) 间 接 证 据 ; (4) 结 果 的 精 
WHE; (5) 发 表 偏 位。 可 能 提高 证 据 质量 的 因素 包 
括 : (1) 大 效应 值 ; (2) 可 能 的 混杂 因素 会 降低 疗效 ; 
(3) 存 在 剂量 -效应 关系 。 

根据 这 套 定量 的 证 据 分 级 系统 ， 采 用 
GRADEpro 3.6 软件 对 本 研究 中 结果 变量 的 RCT 
研究 证 据 及 非 RCT 研究 证 据 结果 进行 评估 ， 呈 现 
元 分 析 结 果 的 证 据 质量 。 


3 结果 


3.1 ”纳入 研究 基本 信息 

共 纳 入 43 个 反 欺 凌 干 预 效果 研究 ， 有效 样本 
51 个 ,总 样本 量 41363 人 (实验 组 N= 23582, 控制 
组 N=17781)。 其 中 ,中文 文献 4 篇 ,英文 文献 39 
篇 。 针 对 欺凌 者 的 干预 样本 4 个 ， 随 机 对 照样 本 2 
+; 针对 欺凌 受害 者 干预 样本 6 个 ， 随 机 对 照样 
本 3 个 ; 针对 所 有 学 生 干 预 样本 42 个 ， 随 机 对 照 
样本 20 个 。 学 生年 龄 6~16 岁 之 间 , 包括 小 学 生 、 
初中 生 和 高 中 生 。 详 细 信 息 见 表 1。 
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3.2” 反 欺凌 项 目 干 预 效果 

异 质 性 检验 结果 显示 , 反 欺 凌 干 预 研 究 间 差异 
性 大 。 对 于 针对 欺凌 者 的 干预 样本 ,欺凌 行为 Q = 
48.23 (p < 0.001), = 93.79, 对 于 针对 欺凌 受害 者 
的 干预 样本 ， 受 欺凌 行为 Q = 18.45 (p < 0.01), P = 
73.04, 心理 健康 Q = 7.95 (p > 0.05), 下 = 49.66 (JL 
R 2)。 针 对 所 有 学 生 的 反 欺凌 干预 样本 中 ,态度 
干预 研究 的 Q = 131.79 (p < 0.001), Ë = 93.05; 行 
为 干预 研究 Q = 330.23 (p< 0.001), P = 87.58; 其 
中 欺凌 行为 改变 的 Q@ = 123.96 (p < 0.001), P = 
70.15; 受 欺 凌 状 况 改 变 的 Q = 354.73 (p < 0.001), 
P = 89.57 ( 见 表 3), 敏感 性 分 析 结 果 显 示 ， 不 存在 
效果 异常 研究 。 

针对 欺凌 者 干预 项 目 对 其 欺凌 行为 的 干预 效 
FR g = 0.57 (95%CI: 0.08, 1.05; Z = 2.30, p < 0.05); 
针对 欺凌 受害 者 干预 项 目 对 其 受 其 凌 行 为 干预 效 
# g = 0.42 (95%CI: 0.10, 0.74; Z = 2.30, p < 0.05), 
对 其 心理 健康 干预 效果 g = 0.40 (95%CI: 0.14, 
0.65; Z = 3.04, p < 0.01) ( 见 表 2)。 对 于 所 有 学 生 的 
干预 项 目 ， 对 态度 的 影响 效果 g = 0.40 (95%CI: 
0.19, 0.61; Z = 3.79, p < 0.001), 对 行为 的 改变 效 
果 g=0.21 (95%CI: 0.15, 0.26, Z = 7.09, p < 0.001), 
其 中 对 于 欺凌 行为 的 效果 g = 0.17 (95%CI: 0.12, 
0.22; Z = 6.91, p< 0.001), 对 于 受 欺 凌 行 为 的 效果 
g = 0.19 (95%CI: 0.12, 0.26; Z = 5.27, p < 0.001) 
( 见 表 4). 
33 ”发 表 偏 倚 
漏斗 图 2~ 图 4 分 别 检验 了 针对 所 有 学 生 的 反 


欺凌 干预 项 目 对 态度 、 欺 凌 行 为 及 受 欺 凌 行 为 的 
干预 效果 研究 是 否 存在 发 表 偏 倚 。 针 对 所 有 学 生 
的 干预 研究 显示 ,学 生态 度 改变 漏斗 图 经 过 剪 补 
法 校正 后 ， 新 增 研究 为 0， 结 果 较 为 稳健 。 以 0.05 
为 检验 水 准 , Eggers 检验 (p = 0.100) 提 示 本 次 纳 
入 研究 的 发 表 偏 倚 较 小 ， 和 漏斗 图 及 剪 补 法 分 析 
结果 一 致 。 但 是 , 不 管 是 欺凌 行为 还 是 受 欺 凌 行 
为 的 漏斗 图 都 不 对 称 ， 坎 凌 行 为 效果 经 剪 补 法 校 
正 后 ， 新 增 研究 14 个 , 校正 后 随机 效应 g = 0.08 
(95%CI: 0.03, 0.14); 受 坎 凌 行为 效果 经 剪 补 法 校 
正 后 , 新 增 研 究 13 个 , 校正 后 随机 效应 g = 0.05 
(95%CI: —0.02, 0.12), 说 明 二 者 可 能 存在 出 版 偏 
差 。Egger’s 检验 (p ws = 0.000, p zm = 0.003) 提 
示 本 次 纳入 计算 欺凌 行为 和 受 欺 凌 行 为 改变 效 表 
的 研究 存在 发 表 偏 傈 ， 和 漏斗 图 及 剪 补 法 分 析 结 
果 一 致 。 
3.4 亚 组 分 析 
WR 4 所 示 ,， 亚 组 分 析 结 果 显 示 ， 对 欺凌 行 
为 改变 效果 量 ， 王 预 周期 ， 干 预 特 征 是 显著 影 
效果 量 的 因素 ,干预 周期 小 于 1 学 期 的 效果 量 (g = 
0.26, p < 0.001) 高 于 干预 周期 大 于 1 学 期 的 效果 量 
(g=0, 11, p<0.001), 具有 统计 学 意义 (p < 0.05)。 
多 水 平 干预 效果 量 (g = 0.30, p < 0.001) 高 于 单独 
个 体 水 平 干预 (g = 0.10, p< 0.001), 差异 统计 学 上 
显著 (p < 0.01)。 非 随机 研究 效果 量 (g = 0, 28, p < 
0.001) 高 于 随机 对 照 研究 效果 量 (g = 0, 12, p < 
0.01), 差异 显著 (p < 0.05)。 同 样 地 ， 如 表 5 所 示 ， 
对 于 受 欺 凌 行 为 , 干预 周期 和 干预 特征 为 显著 地 
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表 2 针对 欺凌 者 或 欺凌 受害 者 的 干预 效果 


干预 对 象 结 N G 95%CI z Q P 
次 凌 者 欺凌 行为 4 0.57 0.08, 1.05 2.30° 48.23 93.79 
次 凌 受 害 者 受 欺 凌 行为 6 0.42 0.10, 0.74 2.60%” 18.55" 73.04 

心理 健康 5 0.40 0.14, 0.65 3.04” 7.95 49.66 


iE: *p < 0.05; **p < 0.01; ***p < 0.001。 下 同 


表 3 针对 所 有 学 生 的 反 欺 凌 项 目 预防 干预 效果 


结果 N G 95%CI Z Q P 
态度 11 0.40 0.19, 0.61 3.79 131.79 94.41 
行为 42 0.21 0.15, 0.26 7.09 330.23” 87.58 
欺凌 38 0.17 0.12, 0.22 6.91 123.96” 70.15 


0.12, 0.26 5 354.73 89.57 
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Funnel plot of standard error by Hedges’s g 


显著 (p= 0.001)。 非 随机 研究 效果 量 (g = 0, 28, p < 
0.001) 高 于 随机 对 照 研究 效果 量 (g = 0, 12, p < 
0.01), 差异 显著 (p < 0.05)。 初 高 中 被 试 的 干预 效 
果 高 于 小 学 生 的 干预 效果 , 但 是 差异 不 具有 统计 
学 上 的 显著 意义 。 
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图 2 针对 所 有 学 生 的 态度 干预 效果 漏斗 图 ; 剪 补 研究 = 0 
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Funnel plot of standard error by Hedges’s g 
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图 4 针对 所 有 学 生 的 受 欺 凌 行 为 干预 效果 漏斗 图 ; 剪 补 
研究 = 13， 随 机 效应 g = 0.05, 95%CI: -0.02, 0.12 
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2.0 1.5 1.0 a 10 15 2.0 35 GRADE 证 据 质量 及 推荐 等 级 
图 3 针对 所 有 学 生 的 欺凌 行为 干预 效果 漏斗 图 ; h i el te nn 
研究 = 14， 随 机 效应 g = 0.08, 95%CI: 0.03, 0.14 行 评估 ,结果 显示 ,对 于 欺 姿 者 的 干预 效果 的 证 
据 质量 为 极 低 。 针 对 欺凌 受害 者 的 干预 效果 ,不 
调节 变量 ,干预 周期 小 于 1 学 期 的 效果 量 (g= FÆ RCT EDR EAE RCT 研究 证 据 质量 都 为 低 。 
0.31, p < 0.001) 高 于 干预 周期 大 于 1 学 期 的 效果 量 针对 所 有 学 生 的 干预 项 目 ， 坎 凌 行 为 或 者 受 其 凌 
(g=0.10,p <0.001), 具有 统计 学 意义 (p < 0.01). 行为 RCT 证 据 为 低 质量 , JE RCT 研究 为 极 低 质 
单独 个 体 水 平 干 预 效 果 量 (g = 0.10, p < 0.001) 低 E, 不 过 态度 改变 RCT 研究 的 证 据 质量 为 中 等 

于 多 水 平 干预 (g = 0.39, p < 0.001), 差异 统计 学 上 È 06)。 
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表 4 欺凌 干预 对 欺凌 行为 改变 效果 量 的 亚 组 分 析 


亚 组 变量 N G 95%CI z Q P p 
年 级 0.228 
小 学 17 0.14 0.09, 0.18 6.18 21.37 25.14 
初 高 中 21 0.20 0.11, 0.29 4.27 100.77 80.15 
干预 周期 0.004 
<= 1 学 期 20 0.26 0.18, 0.35 5.96 64.08 70.35 
> 1 学 期 18 0.11 0.05, 0.17 3.69™ 45.60 62.72 
干预 特征 0.001 
多 水 平 22 0.30 0.20, 0.40 5.97 26.89” 44.22 
个 体 水 平 16 0.10 0.07, 0.17 4.73 62.90 66.61 
实验 设计 0.016 
随机 19 0.12 0.08, 0.17 5.08 47.99" 62.49 


非 随 机 19 0.28 0.16, 0.39 4.67 60.86” 70.43 
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表 5 欺凌 干预 对 受 欺 凌 行 为 改变 效果 量 的 亚 组 分 析 
Z 


亚 组 变量 N G 95%CI Q r p 
年 级 0.457 
小 学 18 0.21 0.14, 0.28 5.93 63.73 73.33 
初 高 中 20 0.16 0.04, 0.28 372 234.53 91.90 
干预 周期 0.003 
<=1 学 期 17 0.31 0.20, 0.42 5.59 98.35 83.73 
>1 学 期 21 0.10 0.02, 0.18 2.38” 170.90™ 88.30 
干预 特征 0.001 
多 水 平 24 0.39 0.24, 0.55 4.88 52.19%" 77.09 
个 体 水 平 14 0.10 0.03, 0.18 2.78” 232.15 90.12 
实验 设计 0.042 
非 随机 20 0.28 0.15, 0.41 4.29 130.97 85.49 
随机 18 0.12 0.04, 0.21 2.77" 198.72” 91.45 


表 6 结果 变量 证 据 GRADE BAR 


士 用 

干预 结局 实验 ”纳入 结果 的 ”间接 ”结果 ”发 表 ; a E 

_ oe — wa 实验 组 对照 台 相对 效应 = “E 

对 象 指标 设计 研究 不 - 致 证 据 | OAOA APAE RN rais 

欺凌 者 欺凌 行为 ”RCT' 2 Mme A Me S 24 24 ”0.96(-1.04, 2.95) pooo 关键 

LOR SWRA «RCT! 2 yee? 无 无 无 209 216 ”0.79(-0.56,2.14) @@OO 关键 

JERCT 3 无 无 无 无 104 63 ”0.33(0.07,0.59) @@00 ”关键 

心理 健康 RCT) 2 严重 无 无 无 209 216 0.57(-0.13, 1.27) poo 关键 

非 RCT 2 无 无 = 无 93 49 “0.49(0.15, 0.84) poo ”关键 

ae 欺凌 行为 ” RCT! 14 严重 ? 无 ”严重 ” 无 1110 1101 0.12(0.08,0.17) @@00 关键 
TPE 

JERCT 10 严重 ? 无 严重 ?3 严重 1505 1776 0.28(0.20,0.40) ooo 关键 

SiR ATA RCT! 13 yea ° 无 ”严重 ” 无 12630 10731 0.12(0.04, 0.21) poo 关键 

JERCT 12 严重 ? 无 ”严重 ， 严重 7697 3791 0.28(0.15,0.41) ooo 关键 

态度 RCT! 6 无 KF x 1479 ”1589 0.34(0.06,0.61) @@@O 重要 

TE: 1 盲 法 和 分 配 隐藏 缺失 ; 2 干预 措施 不 同 、 被 试 特征 差异 导致 结果 不 一 致 ;3 单一 的 问卷 自 评 测量 ; 4 被 试 数量 小 


4 讨论 行为 (Garandeau, Vartio, Poskiparta, & Salmivalli, 
2016; Sahin，2012)。 对 欺凌 受害 者 的 干预 包括 社 

本 研究 更 新 了 已 有 的 元 分 析 ， Hee wet H 交 技 能 训练 、 成 年 人 监管 、 提 供 社会 支持 等 , H 
的 干预 效果 研究 进行 了 系统 分 析 , 结果 发 现 欺 凌 的 在 于 减少 欺凌 带 来 的 负面 心理 问题 ， 并 且 提 高 
干预 是 有 效 的 ,不同 的 反 其 凌 项 目 效果 有 所 差 个 体 的 社交 能 力 、 自 信心 、 求 助 能 力 等 以 降低 受 
异 。 亚 组 分 析 显 示 干 预 周期 越 短 , 干预 水 平 越 多 ， 到 欺凌 的 频率 (Elledge et al., 2010; Fox & Boulton, 
反 欺 凌 干 预 效果 越 好 。 不 过 进一步 的 证 据 质量 评 2003; van der Ploeg et al., 2016)。 尽 管 研 究 显示 这 
价 显示 现 有 的 研究 证 据 质量 较 差 。 些 干预 项 目 是 有 效 的 , 但 是 由 于 研究 数量 有 限 ， 
直接 针对 欺凌 者 或 者 欺凌 者 的 干预 项 目 具 有 元 分 析 结 果 可 靠 性 较 低 。 可 能 的 影响 干预 有 效 性 

中 等 效果 量 。 对 于 欺凌 者 的 干预 包括 共 情 训练 、 的 原因 有 以 下 几 个 方面 : 一 方面 及 时 、 准 确 地 
行为 矫正 ,目的 在 于 减少 欺凌 者 的 攻击 性 和 欺凌 识别 欺凌 存在 一 定 的 困难 。 由 于 许多 欺凌 事件 是 
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没有 被 报告 的 ， 因此 学 校 或 者 教师 未 能 够 及 时 、 准 
确 地 识别 欺凌 者 和 欺凌 受害 者 (Hymel & Swearer, 
2015)。 男 一 方面 ， 这些 干预 是 事后 干预 ,管理 者 
更 加 希望 能 够 预防 欺凌 行为 的 发 生 (Zych，Ortega- 
Ruiz, & Del Rey, 2015)。 还 有 一 种 观点 认为 ,欺凌 
是 群体 行为 ， 劳 观 者 或 者 欺凌 行为 见证 者 的 态度 
和 行为 也 至 关 重 要 (Forsberg et al., 2018)。 

因此 ,针对 所 有 学 生 的 干预 项 目 融合 了 预防 
和 干预 ， 面 对 的 对 象 不 只 是 欺凌 者 或 者 受 欺 凌 者 ， 
还 包括 旁观 者 、 家 长 、 教 师 等 , 干预 内 容 包 括 知 
识 教 育 、 态 度 影响 、 纪 律 、 家 长 参与 等 ， 是 更 为 
Fe OLY SIM A (Evans et al., 2014)。 元 分 析 显 
示 , (1) 干 预 对 学 生态 度 有 中 等 的 效果 量 ,对 于 其 
凑 或 者 受 欺 凌 行 为 的 效果 量 小 但 是 显著 。(2) 态 度 
改变 效果 量 高 于 行为 改变 效果 量 。 相 对 于 行为 ， 
态度 更 容易 发 生 转 变 (Maio & Haddock, 2014)。 另 
外 ,对 于 一 部 分 学 生 而 言 ， 欺 凌 或 者 受 欺 凌 行 为 
的 基线 水 平 本 身 就 较 低 ， 因 此 干预 后 的 变化 较 
小 。Jiménez-Barbero 等 人 (2016) 的 结果 和 本 研究 


系统 多 水 平 的 干预 项 目的 效果 量 高 于 单 水 平 
的 教育 干预 。 从 社会 生态 视角 来 看 ， 欺 凌 不 仅仅 
是 “欺凌 者 "和 “受害 者 "之 间 的 事 , 除了 个 体 的 人 
格 特质 、 行 为 ， 家庭、 同伴 、 学 校 等 系统 都 与 其 
BEATA AY AE EY A SE (Hong, Lee, Lee, Lee, & 
Garbarino，2014)。 多 数 的 教育 干预 针对 的 是 个 体 
的 知识 、 态 度 和 行为 ， 只 在 个 体 水 平 上 进行 干预 。 
越 来 越 多 的 干预 项 目 不 仅 仅 从 个 体 水 平 出 发 , 还 
延伸 到 学 校 、 家 庭 、 社 区 甚至 国家 政策 中 。 例 如 
芬兰 的 Kiva 反 欺 凌 项 目 不 仅 仅 向 学 生 提 供 反 欺 
凌 课 程 ， 还 向 教师 提供 反 其 凌 设 备 材料 ,改变 旁 
观 者 的 角色 ,给 家 长 提供 反 坎 凌 指 导 ， 设 置 “ 反 坎 
凑 街道 论坛， 积极 应 对 网 络 欺凌 等 等 ， 从 不 同 的 
水 平 进行 干预 (Yang & Salmivalli, 2015)。 有 的 干 
预 项 目 还 借助 公共 媒体 传播 反 欺 凌 信 息 (Albayrak 
et al., 2016)。 不 过 ， 多 水 平 的 干预 相对 地 需要 投入 
更 多 的 人 力 、 物 力 和 财力 , 但 是 从 效果 上 来 说 ， 确 
实 有 助 于 欺凌 的 预防 和 干预 。 

随机 实验 设计 和 非 随 机 实验 设计 下 的 反 欺 凌 


相对 一 致 ， 但 是 效果 量 更 低 ， 可 能 的 原因 在 于 本 
研究 计算 效果 量 的 时 候 考 虑 了 基线 数据 ， 根 据 
Carlson 和 Schmidt (1999) 的 检验 ， 只 用 后 测 数据 
计算 的 效果 量 可 能 会 低估 真正 的 效果 。(3) 被 试 的 
欺凌 行为 和 受 欺 凌 行 为 改变 效果 量 没有 差别 。 
Merrell 等 (2008) 发 现 不 同 测量 工具 下 , 报告 的 欺 
凌 结 果 和 受 欺 凌 结 果 并 不 相同 。 尽 管 本 研究 同时 
纳入 了 自 评 、 教 师 评 价 、 家 长 评价 、 观察 数 据 ， 但 
是 大 部 分 研究 采用 的 是 自 评测 量 ， 因 而 没有 对 测 
量 方式 或 者 工具 进一步 细 分 ， 这 可 能 弱化 了 欺凌 
改变 效果 和 受 其 凌 改 变 效 果 之 间 的 差异 。 

对 所 有 学 生 的 干预 研究 异 质 性 大 ， 进一步 的 


项 目 干 预 效 果 也 有 显著 差异 。 已 有 研究 指出 非 随 
机 实验 设计 或 者 队列 设计 的 效果 量 会 高 于 严谨 的 
实验 设计 , 但 是 无 法 提供 解释 (Ttofi & Farrington, 
2011)。 在 控制 了 基线 水 平 的 差异 后 ， 本 研究 发 现 
非 随 机 对 照 干预 的 效果 量 更 高 。 可 能 的 原因 是 非 
随机 设计 的 研究 两 组 被 试 可 能 是 不 同 质 的， 在 没 
有 使 用 随机 化 平衡 异 质 性 的 情况 下 ,容易 获 得 
“好 效果 ”(Hoyt & Del Re, 2017). 

小 学 生还 是 中 学 生 从 干预 项 目 中 获 益 更 多 ? 
本 研究 显示 二 者 没有 显著 差异 ， 与 本 研究 结果 不 
同 的 是 , Lee, Kim 和 Kim (2015) 对 13 个 校园 欺凌 
项 目的 元 分 析 中 发 现 对 初中 生 的 干预 效果 优 于 小 


亚 组 分 析 显 示 , 干预 周期 和 干预 特征 是 欺凌 / 受 欺 
凌 行 为 改变 量 的 显著 调节 变量 。 和 一 个 已 有 的 元 
分 析 一 样 , 干预 周期 越 短 ,干预 效果 越 好 ,这 似 
平 让 人 有 些 菲 夷 所 思 (Jiménez-Barbero et al., 2016)。 
有 一 些 研 究 指 出 ,， 反 欺凌 干预 也 存在 量 效 反 应 
(dose-response)， 表 现 为 越 密集 ， 强 度 越 高 的 干预 
MEA, 效果 越 好 (Ttofi & Farrington, 2011)。 可 能 对 
于 那些 短 周期 的 研究 , 干预 强度 更 高 ,， 更 密集 ,此 
外 ,对 于 那些 干预 周期 很 长 的 研究 ， 可 能 在 干预 
初期 , 起 到 的 教育 或 者 威慑 效果 更 好 , 但 是 ， 随 
着 学 生 的 适应 ,对 欺凌 的 关注 慢 慢 降低 ， 导 致 欺 
凌 事 件 重 新 发 生 。 


学 生 ， 因 为 初中 生 的 认 知 发 展 更 为 成 熟 ， 更 容易 
接受 干预 。 而 另 一 些 研究 又 指出 对 小 学 生 的 干预 
效果 更 好 ， 因 为 他 们 可 塑性 更 强 , 也 更 会 听 老 师 
的 话 (Jimknez-Barbero et al., 2016)。 包括 本 研究 在 
内 的 这 些 元 分 析 的 不 一 致 可 能 在 于 过 于 笼统 地 将 
学 生 划 分 为 小 学 生 或 者 初中 生 。Yeager, Fong, Lee 
和 Espelage (2015) 认 为 这 种 研究 间 的 亚 组 分 析 
(between-study) 是 有 偏差 的 ， 他 们 对 19 个 反 欺 凌 
项 目 研 究 采用 了 多 水 平 的 元 分 析 ， 其 中 年 龄 作为 
第 一 个 水 平 , 结果 发 现 干预 效果 实际 上 随 着 年 龄 
的 上 升 而 下 降 。 
值得 引起 重视 的 是 ,根据 GRADE 证 据 分 级 
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The effect and moderators of school-based anti-bullying 
programs: Meta-analysis and GRADE evidence 
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Abstract: School bullying has become a public health issue in the past several decades which caused 
physical and psychological harm on bullies, victims as well as bystanders. Therefore, a series of 
anti-bullying programs were designed to reduce the bullying or the harmfulness of bullying, but the 
effectiveness of these programs was inconsistent. Forty-three pre-post randomized controlled trail studies 
were selected to examine the effect of school-based anti-bullying programs. The evidence quality was 
screened under the GRADE protocol. Results suggested a significant effect for anti-bullying programs 
which targets bullies (g = 0.57, p < 0.05), while those who target victims, victimization decreased (g = 0.40, 
p < 0.05), and overall metal health improved (g = 0.40, p < 0.01). The pooled effect size indicated that 
school-based anti-bullying programs have a small effect on bullying and victimization (g = 0.17, p < 0.001) 
and influenced by publication bias. Attitude changed moderately (g = 0.19, p < 0.001). The evidence of 
attitude change was moderate, other outcome variables have a very low or low evidence quality according to 
GRADE protocol. For the programs targeting universal students, programs which was less than one semester 
performed better, and the global intervention showed more effective than education. The effect size of 
anti-bullying programs targeting bullies or victims was moderate, but more research is needed. Though 
school-based anti-bullying programs which target universal students have a relatively small effect size, 
however, they are practical for real-world applications. The dose of intervention and the feature of programs 
have influence on the effect of anti-bullying programs. 
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